DOL:10.11931/guihaia.gxzw201906024 


基于 叶绿体 基因 组 探讨 桃 金 女 目 及 其 近 缘 类 群 的 系统 发 育 
关系 
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摘要 : 该 研究 基于 叶绿体 基因 组 数据 ， 对 桃 金 娘 目 (6 科 44 属 97 种 ) МЕЖЕ HEE 
儿 苗 目 2 科 5 属 25 种 ) 的 系统 发 育 关系 进行 了 分 析 。 结 果 表 明 : (1) 桃 金 娘 目 基因 组 大 小 
为 15.2~17.1 kb, 包 括 的 蛋白 质 编 码 基因 数目 为 74~90 个 ,牧牛 儿 苗 目 基 因 组 大 小 为 11.6~24.2 
kb， 包 括 的 蛋白 质 编码 基因 数目 为 73~132 个 ; (2) 对 比 叶绿体 基因 组 序列 和 和 蛋白 质 编码 基 
因 所 构建 的 系统 发 育 树 结果 ， 在 目 间 及 御 牛 儿 苗 目 内 差异 显著 ， 桃 金 娘 目 内 基本 一 致 ，(3) 
基于 和 蛋白 质 编码 基因 所 构建 的 系统 发 育 树 表 明 , 桃 金 娘 目 和 牧牛 儿 苗 目 均 为 单 系 , 为 姐妹 类 
群 ， 桃 金 女 目 内 形成 两 个 大 支 ， 桃 金 娘 科 、Vochysiaceae、 野 牡丹 科 形 成 一 支 ， 其 中 桃 金 女 
科 和 Vochysiaceae 关系 较 近 是 姐妹 群 ， 柳 叶 菜 科 、 千 届 菜 科 和 使 君子 科 形 成 男 一 支 ， 其 中 柳 
叶 沫 科 和 于 屈 菜 科 关系 较 近 为 姐妹 群 ， 科 级 水 平 ， 桃 金 娘 科 、Vochysiaceae、 对 牡丹 科 、 柳 
叶 菜 科 、 千 届 菜 科 、 使 君子 科 和 敌 牛 儿 苗 科 均 为 单 系 〈 仪 包括 一 个 物种 的 科 除 外 ); (4) Ж 
RPÉCG TUS Леза А TEKE C50 对 和 蛋白质 编码 基因 序列 变异 分 析 的 结果 表明 ， 野 牡丹 
科 19 个 属 的 共享 变异 基因 数目 为 53 个， 变异 百分数 范围 为 5.84%~29.53%， 桃 金 娘 科 9 个 
属 的 共享 变异 基因 数目 为 $7 个 , 其 变异 百分数 范围 为 1.31%~15.78%。 本 研究 结果 为 进一步 
研究 桃 金 娘 目 及 相关 科 属 的 系统 发 育 提 供 了 理论 依据 。 
关键 词 : 敌 牛 儿 苗 目 ， 桃 金 娘 科 ， 野 牡丹 科 ， 和 蛋白 质 编码 基因 ， 系 统 发 育 
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Abstract: In this study, we used the information on the chloroplast genomes to analyze the 
phylogenetic relationships of Myrtales (97 species representing 44 genera in six family) and 
related groups (Geraniales, 25 species representing five genera in two family). The genome size of 
Myrtales ranged from 15.2 kilo base pairs (kb) to 17.1 kb, including 74 to 90 protein-coding genes. 
The genome size of Geraniales ranged from 11.6 kb to 24.2 kb, including 75 to 132 protein-coding 


genes. Phylogenetic analyses of whole genome and protein-coding genes yielded contradicting 
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topologies for intra-order and Geraniales, but congruence results were found in Myrtales. The 
phylogenetic tree based on protein-coding genes provided strong support for the monophyly of 
Myrtales and Geraniales and for the placement of Myrtales sister to the Geraniales. Within 
Myrtales, two major clades were identified. The first clade comprised a Melastomataceae lineage 
sister to a Myrtaceae + Vochysiaceae lineage and the second clade included Combretaceae sister to 
a subclade formed by the Onagraceae and Lythraceae lineages. At family level, Myrtaceae, 
Vochysiacea, Melastomataceae, Lythraceae, Onagraceae, Combretaceae and Geraniaceae were 
strongly supported as monophyletic (family that represented by only one species was excluded). 
The placement of Punica and Trapa in Lythraceae were supported. Additionally, the sequence 
divergence of the protein-coding genes was estimated. For Melastomataceae, 53 variable 
protein-coding genes were identified, with the variation percentage ranged from 5.8446 to 29.5396 
among the 19 genera. In Myrtaceae, the proportion of variability of 57 variable protein-coding 
genes ranged from 1.31% to 15.78% among the 9 genera. Out study provided an important 
framework for further phylogenetic study in Myrtales and related groups. 

Key words: Geraniales, Myrtaceae, Melastomataceae, protein-coding genes, phylogeny 


在 分 子 系统 学 发 展 之 初 , 人 们 常 利 用 单个 基因 或 者 儿 个 基因 来 解决 类 群 的 系统 发 育 关 系 ， 
对 于 某 些 类 群 而 言 ， 可 能 得 到 较 理想 的 结果 ， 而 对 于 某 些 特殊 类 群 ， 如 进化 速率 较 慢 的 类 群 
或 辐射 进化 的 类 群 ， 由 于 缺乏 足够 的 信息 位 点 ， 研 究 遇 到 阻 清 。 通 过 增加 基因 数目 及 联合 分 
析 的 方法 , 在 一 定 程 度 上 ， 研 究 者 可 以 提高 系统 发 育 树 的 分 辨 率 及 支持 率 。 随 着 二 代 测 序 技 
术 的 发 展 , 测序 成 本 的 降低 ,使 得 系统 发 育 基 因 组 学 应 运 而 生 。 叶 绿 体 基因 组 由 于 其 大 小 适 
中 ,便于 测序 及 后 期 组 装 拼 接 , 且 在 不 同类 群 之 间 具 有 良好 的 共 线 性 ( 张 韵 洁 和 李 德 铁 ,2011 )， 
因而 在 系统 发 育 分 析 中 得 到 广泛 应 用 。 截 止 2019 年 4 月 NCBI 数据 库 中 的 叶绿体 基因 组 数 
据 达 3000 多 个 ， 而 在 2010 年 10 月 仅 为 146 个 ， 其 数据 增长 呈 爆 发 之 式 ， 为 系统 发 育 研 究 
提供 了 便利 及 机 遇 。 目 前 ， 叶 绿 体 基因 组 已 应 用 于 研究 被 子 植物 不 同 阶层 的 系统 发 育 关 系 ， 
QUE fa B Citrus) CCarbonell-Caballero et al.，2015)、 棉 属 (Gossypium) (Wu et al.，2018)、 
不 本 科 (Poaceae) (Pessoa-Filho et al.，2018)、 兰 科 (Orchidaceae) (Dong et al., 2018). A47 
H (Caryophyllales) (Liu et al., 2018). 3*H(Zingiberales) (Wu et al., 2018) 及 被 子 植物 
框架 (Bausher et al., 2006). 
桃 金 娘 目 Myrtales RETH HAAR, GE Г Ж EM FARR SUN 
文 持 ， 而 桃 金 娘 目 在 蔷薇 类 中 的 系统 位 置 未 定 ， 一 直 为 研究 者 所 关注 。 基 于 rbcL 的 分 析 结 
RAH, MER A EAS PALE ЛЧ Е (Hilu etal, 2003). Zhu et al. (2007) 基于 1 个 
线粒体 基因 、2 个 叶绿体 及 1 个 核 基因 片段 联合 分 析 的 结果 表明 ， 桃 金 娘 目 可 能 和 敌 牛 儿 苗 
目 (Geraniales) 的 关系 较 近 (无 支持 率 ), 共同 组 成 了 蔷 蔽 类 的 基部 类 和 群 。 而 Wang et al. (2009) 
基于 12 个 基因 (10 个 叶绿体 基因 、2 个 核 基 因 ) 联合 分 析 的 结果 表明 ， 桃 金 女 目 和 牧牛 儿 
苗 目 关系 较 近 ， 形 成 中 等 支持 率 的 一 文 ， 均 隶属 于 锅 葵 类 植物 malvids CHI EC OX AAW 
eurosids I )， 为 锦 蓉 类 植物 其 余 科 的 姐妹 群 
桃 金 女 目 包含 9 科 380 JE, 2 13 000 种 (The Angiosperm Phylogeny Group, 2016), 3€ 
ET 6% 左右 的 核心 真 双子 叶 植 物 类 群 ,目下 所 包括 的 9 个 科 中 ,Crypteroniaceae、Alzateaceae 
及 Penaeaceae 所 包括 的 物种 数 较 少 ，99% 以 上 的 物种 分 布 于 其 余 6 科 ， 依 次 为 桃 金 娘 科 
(MYyrtaceae)、 野 牡丹 科 (Melastomataceae)、 柳 叶 菜 科 (Onagraceae)、 和 王 届 荣 科 (Lythraceae)、 使 
君子 科 (Combretaceae) 及 Vochysiaceae。 关 于 桃 金 妇 目的 分 子 系统 学 研究 主要 有 : Conti et al. 
(1997) 基于 rbcL 序列 的 研究 结果 表明 桃 金 娘 科 可 能 与 野 牡丹 科 关 系 较 近 ， 柳 叶 菜 科 和 干 
局 菜 科 是 姐妹 群 ， 而 使 君子 科 系 统 位 置 未 定 。Sytsma et al. (2004) 基于 rbcL 和 ndhF 序列 ， 
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进一步 扩大 采样 范围 , 研究 了 桃 金 娘 目 内 科 之 间 的 系统 发 育 关 系 , 结论 表明 使 君子 科 可 能 是 
该 目的 基部 类 群 ， 与 目 内 其 它 科 为 姐妹 群 关系 (支持 率 不 高 )， 桃 金 娘 科 可 能 是 野 牡丹 科 + 
Memecylaceae 的 姐妹 群 , ЖИТ ЗЕБИ Hi ЕЛАН Ж KR FR RBC жЕ» Soltis et al. (2011) 
基于 17 个 基因 的 数据 结果 表明 桃 金 娘 目 和 牧牛 儿 苗 目 为 姐妹 群 ， 获 中 等 支持 率 支持 。 

综 上 ， 桃 金 娘 目的 近 缘 类 群 未 定 ， 目下 科 之 间 的 关系 尚 需 进一步 研究 。 CANFAS 
学 研究 表明 在 该 类 群 中 , 基于 单个 基因 或 几 个 基因 的 联合 分 析 , 均 不 能 得 到 稳定 的 系统 发 育 
树 。 本 研究 利用 公共 数据 库 中 已 公开 发 表 的 桃 金 娘 目 6 个 主要 科 及 其 近 缘 类 群 的 叶绿体 基因 
组 数据 ,通过 系统 发 育 树 重建 ， 获 得 高 支持 率 且 高 分 辩 率 的 桃 金 女 目 的 系统 发 育 框架 ， 确 定 
了 桃 金 娘 目 与 自 牛 儿 苗 目的 姐妹 群 关系 , 并 进一步 确认 了 使 君子 科 是 柳 叶 菜 科 和 千 屈 菜 科 的 
姐妹 群 。 此 外 , 我 们 对 桃 金 女 科 和 野 牡 丹 科 的 蛋白 质 编码 基因 的 序列 变异 程度 进行 了 统计 分 
析 ， 为 后 续 相 关 科 的 系统 发 育 研究 提供 数据 参考 。 

1 材料 和 方法 
1.1 数据 收集 

从 GenBank 数据 库 中 下 载 已 发 表 的 桃 金 娘 目 6 科 44 属 97 ЯШЕ АЕ ДЕ Н 2 RES 属 25 
种 的 叶绿体 全 基因 组 序列 及 蛋白 质 编 码 基因 ( 表 1D. 12 H (Malvales )3 种 、 十 字 花 目 
(Brassicales) 2 PH, 12 H (Huerteales) 1 种 ,无 患 子 目 (Sapindales) 5 种, 作为 外 类 群 ( 表 1)。 
利用 Excel 统计 每 个 叶绿体 基因 组 的 大 小 及 蛋白 质 编 码 基因 的 数目 。 

d 1 物种 名 称 ， 序 列 编号 ， 基 因 组 大 小 和 基因 数目 


Tablel Таха included in the study with GenBank accession numbers, genome size, and number of 


genes 
种 名 GenBank 编号 序列 长 度 PERDE 
因数 目 
Number of 
Taxon bM MED Length (bp) protein-coding 
Numbers 
genes 
桃 金 娘 目 Myrtales 
使 君子 科 Combretaceae 
红 槛 李 Lumnitzera littorea МС182696.1 159 687 84 
Laguncularia racemosa MK726017.1 160 378 84 
Terminalia guyanensis MK726027.1 159 750 83 
FEP} Lythraceae 
Lagerstroemia fauriei KT358807.1 152 440 85 
L. floribunda KX765488.1 152 240 85 
FEIRE L. guilinensis KU885923.1 152 193 85 
K L. indica KF572028.1 152 231 84 
ЖЩ L. indica KX263727.1 152 205 86 
云南 紫 微 L. intermedia KX852427.1 152 330 85 
L. speciosa KU821692.1 152 476 85 
L. speciosa KX572149.1 152 526 84 
В 290 L. subcostata KF572029.1 152 049 84 
4A Punica granatum KY635883.1 158 633 84 


Ж} Trapaceae 
Trapa maximowiczii KY705084.1 155 577 82 


野 牡 丹 科 Melastomataceae 
Allomaieta villosa 

Barthea barthei 

Bertolonia acuminata 
Blakea schlimii 

Eriocnema fulva 
Graffenrieda moritziana 
Henriettea barkeri 
Melastoma candidum 
Merianthera pulchra 
Miconia dodecandra 
Nepsera aquatica 
Opisthocentra clidemioides 
Pterogastra divaricata 
Rhexia virginica 
Rhynchanthera bracteata 
Salpinga maranonensis 
Tibouchina longifolia 
VRBE Tigridiopalma magnifica 
Triolena amazonica 
桃 金 娘 科 Myrtaceae 
Acca sellowiana 
Allosyncarpia ternata 
Angophora costata 

A. floribunda 

Corymbia citriodora subsp. citriodora 
C. citriodora subsp. variegata 
C. eximia 

C. gummifera 

C. henryi 

C. maculata 

C. tessellaris 

C. torelliana 

Eucalyptus aromaphloia 

E. baxteri 

赤 核 E. camaldulensis 

E. cladocalyx 

E. cloeziana 

E. curtisii 

E. deglupta 

E. delegatensis 

E. diversicolor 

E. diversifolia 


E. elata 


KX826819.1 
KY873324.1 
KX826820.1 
KX826821.1 
KX826822.1 
KX826823.1 
KX826824.1 
KY745894.1 
KX826825.1 
KX826826.1 
KX826827.1 
KX826828.1 
KX826829.1 
KX826830.1 
KX826831.1 
KX826832.1 
KX826833.1 
MF663760.1 
KX826834.1 


KX289887.1 
KC180806.1 
KC180805.1 
KC180804.1 
KP015029.1 
KM885985.1 
KC180802.1 
KC180800.1 
KP015032.1 
KC180801.1 
KC180803.1 
KP015033.1 
KC180789.1 
KC180773.1 
KC180791.1 
KC180786.1 
KC180779.1 
KC180782.1 
KC180792.1 
KC180771.1 
KC180795.1 
KC180774.1 
KC180776.1 


156 452 
155 951 
156 045 
155 862 
155 994 
155 733 
156 527 
156 682 
156 168 
157 216 
155 110 
156 352 
154 948 
154 635 
155 108 
153311 
156 789 
155 663 
156 652 


159 370 
159 593 
160 326 
160 245 
159 995 
160 146 
160 012 
160 713 
160 095 
160 045 
160 127 
159 994 
160 149 
160 032 
160 164 
160 213 
160 015 
160 038 
160 177 
159 724 
160 214 
159 954 
159 899 


85 
82 
85 
85 
85 
84 
85 
85 
85 
85 
85 
85 
84 
85 
85 
83 
85 
84 
85 


85 
85 
85 
85 
85 
84 
85 
85 
85 
85 
85 
84 
85 
85 
85 
85 
85 
85 
85 
85 
85 
85 
85 


E. erythrocorys 

1 E. globulus 
蓝 核 E. globulus subsp. globulus 
XE E. grandis 

E. guilfoylei 

E. marginata 

蜜 味 核 E. melliodora 
ЛУЇ Е. microcorys 
E. nitens 

E. obliqua 

E. patens 

E. pauciflora 

E. polybractea 

E. radiata 

E. regnans 

ЖИ Е. saligna 

E. salmonophloia 

E. sieberi 

E. spathulata 

E. torquata 

E. umbra 

E. verrucata 

Plinia trunciflora 


1 


TA 


Л Psidium guajava 


my 


和 石榴 P. guajava 


Stockwellia quadrifida 


乌黑 Syzygium cumini 
HHP} Onagraceae 
Epilobium ulleungensis 

毛 草 龙 Ludwigia octovalvis 
Oenothera argillicola 

月 见 草 О. biennis 


О. elata subsp. elata 


О. elata subsp. hookeri 


TEA LE О. glazioviana 


О. grandiflora 


曲 序 月 见 草 O. oakesiana 
小 花 月 见 草 O. parviflora 


O. picensis subsp. picensis 


O. villaricae 


长 毛 月 见 草 O. villosa subsp. villosa 
Vochysiaceae 
Vochysia acuminata 


Salvertia convallariodora 


KC180799.1 
KC180787.1 
AY780259.1 
HM347959.1 
KC180798.1 
KC180781.1 
KC180784.1 
KC180797.1 
KC180788.1 
KC180769.1 
KC180780.1 
MG921592.1 
KC180785.1 
KC180770.1 
KC180777.1 
KC180790.1 
KC180796.1 
KC180775.1 
KC180793.1 
KC180794.1 
KC180778.1 
KC180772.1 
KU318111.1 
KX364403.1 
KY635879.1 
KC180807.1 
GQ870669.3 


MH198310.1 
KX827312.1 
EU262887.2 
EU262889.2 
KT881169.2 
KT881170.1 
EU262890.2 
KT881173.1 
KT881176.1 
EU262891.2 
KX118607.1 
KX118606.1 


KX687910.1 


MK726031.1 
MK726026.1 


159 742 
160 267 
160 286 
160 137 
160 520 
160 076 
160 386 
160 225 
160 271 
159 527 
160 187 
159 942 
160 268 
159 529 
160 031 
160 015 
160 413 
159 985 
161 071 
160 223 
159 576 
160 109 
159 512 
158 841 
158 896 
159 561 
160 373 


160 912 
159 396 
165 061 
164 796 
165 403 
165 359 
165 359 
166 545 
163 575 
163 367 
167 092 
165 779 


164 312 


171 315 
171 267 


85 
85 
90 
74 
85 
85 
85 
85 
85 
85 
85 
84 
85 
85 
85 
85 
85 
85 
85 
85 
85 
85 
84 
84 
83 
85 
87 


85 
82 
84 
84 
84 
84 
84 
84 
84 
84 
87 
87 


84 


87 
87 


Ruizterania albiflora MK726023.1 162 345 84 
Qualea grandiflora MK726022.1 163 026 84 
Korupodendron songweanum MK726013.1 161 149 83 
Erisma bracteosum MK726009.1 160 687 85 
Callisthene erythroclada MK726008.1 161 626 84 
ЕЛАН Geraniales 

HE LEB Geraniaceae 

Erodium absinthoides KJ523886.1 162 618 90 
E. carvifolium HQ713469.1 116 935 75 
E. chrysanthum KJ701602.1 168 946 97 
Monsonia emarginata KT692738.1 156 877 82 
M. marlothii KT692739.1 134 416 75 
Pelargonium alternans KF240617.1 173 374 97 
P. australe KM459517.1 165 508 97 
P. citronellum KM527888.1 171 223 97 
P. cotyledonis KM459516.1 166 111 97 
P. cucullatum KM527887.1 170 963 97 
P. dichondrifolium KM459515.1 167 836 97 
P. dolomiticum KM527889.1 202 749 117 
P. echinatum KM527891.1 170 212 97 
P. exhibens KM527890.1 171 665 98 
P. exstipulatum KM527892.1 168 732 97 
P. fulgidum KM527893.1 171 502 97 
P. incrassatum KM527894.1 173 196 97 
P. myrrhifolium KM527895.1 173 272 99 
P. nanum KM527896.1 173 496 97 
P. quercifolium KM527897.1 170 569 97 
P. tetragonum KM527899.1 173 410 99 
P. transvaalense KM527900.1 242 575 132 
P. trifidum KM527898.1 199 553 116 
Hypseocharis bilobata KF240616.1 165 002 85 
Vivianiaceae 

Viviania marifolia KF240615.1 157 291 86 
外 类 群 Outgroups 

十 字 花 目 Brassicales 

十 字 花 科 Brassicaceae 

鼠 耳 芥 Arabidopsis thaliana КХ551970.1 154 515 83 
欧洲 油菜 Brassica napus GQ861354.1 152 860 87 
十 次 花 目 Huerteales 

JEU RI Tapisciaceae 

ARUN Tapiscia sinensis MF926267.1 161 100 85 
2 Ң Malvales 

梧桐 科 Sterculiaceae 

可 可 Theobroma cacao HQ336404.2 160 604 85 


УВ} Malvaceae 


陆地 棉 Gossypium hirsutum DQ345959.1 160 301 85 

龙 脑 香 科 Dipterocarpaceae 

Shorea pachyphylla MH841940.1 150 753 81 

无 患 子 目 Sapindales 

HUN} Aceraceae 

三 角 枫 Acer buergerianum KY419137.1 156 461 88 

芸香 科 Rutaceae 

MHIS Citrus sinensis DQ864733.1 160 129 89 

橄榄 科 Burseraceae 

Commiphora wightii MF957201.1 156 064 86 

苦 木 科 Simaroubaceae 

Leitneria floridana KT692940.1 158 763 87 

EPIRI Anacardiaceae 

芒果 Mangifera indica KY635882.1 157 780 83 
1.2 构建 矩阵 

全 基因 组 序列 使 用 CIPRES Science Gateway (Miller et al., 2010) 在 线 工具 MAFFT v 


7.394 (Katoh 


& Standley, 2013) 软 伯 


白质 编码 基因 


软件 对 序列 进行 比 对 。 比 对 结果 在 MEGA 7.0 软件 (Kumar et al., 


lis 


1.3 系统 发 育 分 析 


进行 系统 发 育 分 


GTRGAMMA 模型 , 采用 快速 靴 代 值 (rapid bootstrap) 分 析 ， 
应用 MrBayes у 3.2.5 CRonquist & Huelsenbeck, 2003) 进行 贝 叶 斯 推断 分 析 ， 选 择 
GTR+GAMMA 模型 。 BI 分 析 的 参数 设置 为 : Ж) 
运行 1000 000 代 ， 每 1000 代 取 样 一 次 ， 开 始 的 25% 样 品 作为 老化 样 


桃 金 娘 目 


码 基因 数目 在 74~90 之 间 ， 


基于 所 获得 的 矩阵 分 别 采 月 


F 对 序列 进行 比 对 ， 


分 析 。RaxML 分 析 运 


叶绿体 全 基因 


ANS 


Л 


均值 为 


85 (#2. Al). ЕЛАНА А26 


参数 设置 为 默认 值 。 


每 个 物种 的 蛋 
按 字母 排序 ， 连 接 ， 采 用 CIPRES Science Gateway 在 线 工 具 MAFFT v 7.394 


2016) 中 进行 


日 最 大 似 然 法 (Maximum likelihood, ML) 及 贝 叶 斯 
软件 RaxML ver.8.2.8 (Stamatakis，2014)， 选 择 
重复 1000 7X (Bootstrap, BS). 


部 分 人 工 校 


lli CBI) 


| MCMC (Markov chain monte carlo) 算法 ， 


Ж (Burn-in samples) 
舍弃 ,以 剩余 样本 构建 主要 规则 一 致 树 并 计算 各 分 支 的 后 验 概率 (posterior probability, РР). 


结果 与 分 析 
2.1 基因 组 大 小 


日 大 小 在 152 049-171 315 bp 之 间 , 平均 值 为 15.9 kb, 和 蛋白质 编 


因 组 大 小 在 


116 935~242 575 bp 之 间 ， 基 因 组 大 小 平均 值 为 17.0kb， 和 蛋白 质 编码 基因 数目 在 75-132 之 
司 ， 平 均值 为 97 ( 表 2， 图 1)。 
dé 2 基因 组 大 小 和 蛋白 质 编码 基因 的 比较 


Table 2 Comparison of genome size and protein-coding genes 


类 群 基因 组 大 小 蛋白质 编码 基 基 
Groups Genome size Protein-coding gene 
ИЗ 标准 凑 
Standard Standard 
平均 值 Mean deviation 平均 值 Mean deviation 
桃 金 女 目 Myrtales 159 374 3 763 85 1 


He ДАЛИ Н Geraniales 170 721 22 175 97 12 


200 000 4 


180 000 -] 
g 1004 
160 000 -] E] 
140 000 -] 3 a0 4 
120 000 4 5 
100 000 - 60 - 
во 000 4 
$ 40 -] 
60 000 - 
40 000 У 
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20 000 4 
0 二 r od i 


桃 金 娘 目 Myrtales ВЕЛЛ Geraniales 桃 金 娘 目 Myrtales ЗВЕЛИ) Geraniales 


图 1 基因 组 大 小 和 和 蛋白质 编码 基因 的 比较 


Fig. 1 Comparison of genome size and protein-coding genes 


d 


基因 组 大 小 Genome size 
蛋白 质 编码 基因 Prot 


2.2 ЖЕЛТ 

为 了 验证 叶绿体 基因 组 在 不 同 分 类 单元 系统 发 育 分 析 中 的 应 用 性 ， 我 们 构建 了 两 套 甜 
VE, 即 基于 叶绿体 全 基因 组 序列 形成 的 矩阵 和 基于 蛋白 质 编码 基因 形成 的 矩阵 。 经 序列 比 对 
及 人 工 校 正 我 们 一 共 获 得 6 个 和 矩阵: (1) 由 叶绿体 全 基因 组 序列 构成 的 3 个 矩阵 ， 由 桃 金 女 
目 、 牧 牛 儿 苗 目 及 外 类 群 构 成 的 包括 139 条 序列 的 矩阵 (和 矩阵 1)、 由 桃 金 娘 目 构成 的 包括 
103 条 序列 的 矩阵 《和 抑 阵 3)、 由 牧牛 儿 苗 目 构成 的 包括 25 ZR PPAR GERE 5); (2) 由 
蛋白 质 编码 基因 构成 的 3 个 矩阵 : 相应 的 由 桃 金 娘 目 、 憩 牛 儿 苗 目 及 外 类 群 构成 〈 抢 阵 2)、 
仅 包 括 桃 金 娘 目 〈 和 抑 阵 4) ЛЕ ЕЛИН GERE 6) КЕЕ. 

和 矩阵 信息 详 见 表 3。 其 中 由 秩 牛 儿 苗 目的 叶绿体 全 基因 组 序列 构成 的 矩阵 即 矩 阵 5 最 大 ， 
长 度 为 762 293 bp， 其 中 变异 位 点 的 数目 为 205 260， 信 息 位 点 的 数目 为 93 186 (12.22%), 
缺失 数据 比例 为 77.60%。 仅 由 桃 金 娘 目 的 蛋白 质 编码 基 因 构 成 的 抢 阵 即 矩阵 4 最小， 长度 
为 113 097 bp， 其 中 变异 位 点 的 数目 为 26 162， 信 息 位 点 的 数目 为 18 171 (16.07%), RHE 
数据 比例 为 30.09% (#3). 


表 3 矩阵 信息 统计 


Table 3 Information of matrix 


FERE 矩阵 长 度 变异 位 点 信息 位 点 缺失 数据 
Matrix АП sites Variable sites кышын Missing data 
Sites 
Ж: 1 Matrix 1 592 879 249 452 149 806 72.8096 
矩阵 2 Matrix 2 186 769 53 589 39 804 571.3696 
HERE 3 Matrix 3 240 022 87 025 64 590 33.6096 
HERE 4 Matrix 4 113 097 26 162 18 171 30.09% 
AERE 5 Matrix 5 762 293 205 260 93 186 71.6096 
HERE 6 Matrix 6 159381 31 722 18 004 47.86% 


2.3 SETA AEE ASE OT 

我 们 对 基于 不 同 数据 集 所 构建 的 系统 发 育 树 结 果 进 行 了 比较 分 析 。 支 持 率 方面 ， 基 于 
叶绿体 全 基因 组 序列 与 基于 和 蛋白质 编 码 基因 的 系统 发 育 树 在 目 间 , 及 桃 金 女 目 内 没有 明显 差 
异 。 但 在 秩 牛 儿 苗 目 内 ， 基 于 叶绿体 全 基因 组 序列 构建 的 系统 发 育 树 支 持 率 明显 降 低 ， 其 中 
支持 率 >95% 的 分 支 为 68%， 而 基于 和 蛋白质 编码 基因 所 构建 的 系统 发 育 树 中 ,支持 率 >95% 的 
分 支 为 95% (2). 
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大 于 等 于 某 一 车 代 值 分 支 所 
Proportion ofb ranches w itha boots пар 


0.7 —e— V.C й Bootstrap value 250 


—а— + КҖ ih Bootstrap value 275 


support abow a given tlueshold 


—ж*— Hit ià Bootstrap value 295 


55 E 1 Matrix 1 142 Matrix 2 56 IE 3 Matrix 3 56 I 4 Matrix 4 58 IE 5 Matrix 5 3146 Matrix 6 
JEP Matrix 


图 2 жм RRA АУА 
Fig. 2 Summary of bootstrap values for maximum likelihood analysis 
拓扑 结构 方面 。 对 包括 139 条 序列 的 系统 发 育 树 进 行 分 析 , 两 个 数据 集 当 中 桃 金 娘 目 和 
牧牛 儿 苗 目 均 形成 了 单 系 ， 支 持 率 为 100%， 外 类 群 中 的 锦 葵 目 在 全 基因 组 序列 数据 集中 并 
未 形成 时 系 〈 图 3)。 桃 金 女 目 两 个 数据 集 的 系统 发 育 树 的 拓扑 结构 基本 一 致 ， 仅 在 校 属 
Eucalyptus 和 月 见 草 属 Oenothera 内 部 有 微小 差异 。 牧 牛 儿 苗 目 两 个 数据 集 所 构建 系统 发 育 
树 的 拓扑 结构 则 存在 显著 差异 ， 叶 绿 体 全 基因 组 数据 集中 ， 牧 牛 儿 苗 科 Geraniaceae 未 形成 
Е, FILER AHAI E Erodium, REZ Ji Pelargonium f Monsonia 均 未 形成 单 系 ， 
而 蛋白 质 编 码 基因 数据 集中 ， 牧 牛 儿 苗 科 及 科 下 的 属 均 为 单 系 ( 图 4)。 


ШЕШ 0 Myrtaceae ШЕШ iLi Geraniaceae 
E Vochysiaceae 
I  vwianiaceae 
М 野 牲 丹 科 Melastomataceae 
ШЕШ 5281 Onagraceae 
ШЕШ oii Lythraceae 
ШЕШ 5 #1 Combretaceae 
a) 叶绿体 基因 组 Chloroplast genomes b) 蛋白 质 编码 基因 Protein-coding genes 
HERA 
Myrtales 
牧牛 儿 苗 日 
Geraniales 
Bibi Tepiscia sinensis hiiti Gossypium hirsutum 
陆地 棉 Gossypium hirsutum TIT] Theobroma cacao REA 
可 可 Theob Malvales 
eobroma cacao Shorea pachyphylla 
‘Shores pachyphylla JHF Arabidopsis thaliana 十 字 花 目 
欧洲 油菜 i 
欧洲 油菜 Brassica napus 欧洲 油菜 Brassica napus Brassicales 
"S " “ae TE 
# HF Arabidopsis thaliana ich Tapiscia sinensis [| КИЛЕН 
T flori Huerteales 
eitneria floridana 芒果 Mangifera indica 
ЯН Citrus sinensis Commiphora wightii 
三 角 机 Acer buergerianum 三 角 枫 Acer buergerianum 无 患 子 目 
Sapindales 
Commiphora wightii Leitneria floridana d 
芒果 Mangifera indica 甜 要 Citrus sinensis 
— 04 ——— 01 


T 


ik: 数字 代表 分 支 的 靳 代 值 BS; 靳 代 值 为 100 的 不 显示 。 


Note: Nodes are labeled with maximum likelihood bootstrap support; Nodes with 100% bootstrap support in the 


maximum likelihood analysis are unlabeled. 
3 基于 不 同和 矩阵 构建 的 桃 金 娘 目 和 秩 牛 儿 苗 目 的 最 大 似 然 ML) 树 
Fig. 3 Maximum likelihood of phylogenetic hypothesis of Myrtales and Geraniales based 


different datasets 
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a) 叶绿体 基因 组 Chloroplast genomes 
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b) 蛋白 质 编码 基因 Protein_coding genes 


P. incrassatum 

P. fulgidum 
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P. echinatum 
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P. quercifolium 

P. nanum 
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M. marlothii 
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0.1 


TE: BPR SCTE BS; HUBS 100 的 不 显示 。 


Note: Nodes are labeled with maximum likelihood bootstrap support; Nodes with 10046 bootstrap support in the 


maximum likelihood analysis are unlabeled. 


图 4 基于 不 同和 矩阵 构建 的 牧牛 儿 苗 


目的 最 大 似 然 ML) 树 


Fig. 4 Maximum likelihood of phylogenetic hypothesis of Geraniales based different 


datasets 


2.4 桃 金 娘 目 和 牧牛 儿 苗 目的 系统 发 育 关系 


根据 上 述 结果 ， 我们 选择 了 包括 139 条 序列 136 个 物种 (包括 亚 种 ) 的 蛋白 质 编码 基因 
WIERE ОЕ 2)， 分 别 进行 最 大 似 然 法 建树 及 贝 叶 斯 分 析 。 久 


E 阵 长 度 为 186 769 bp， 其 中 变 


异 位 点 的 数目 为 53 589， 信 息 位 点 的 数目 为 39 804 (21.31%), 缺失 数据 比例 为 57.36%。 采 


用 最 大 似 然 法 我 们 获得 了 高 分 辨 紊 的 系统 发 育 树 (图 


5), 其 平均 支持 率 为 95%, 支持 率 >95% 


的 支 所 占 比重 为 87.5%。 目 级 水 平 ， 外 类 群 的 锦 葵 目 、 


上 字 花 目 、 十 雌花 目 、 无 患 子 目 与 内 


类 群 的 桃 金 娘 目 、 牧 牛 儿 苗 目 均 为 单 系 (BS=100%; PP=1.0)。 科 级 水 平 ， 桃 金 娘 目 下 的 桃 
金 女 科 、 野 牡丹 科 、 柳 时 荣 科 、 于 屈 菜 科 、 使 君子 科 和 Vochysiacea 及 牧牛 儿 苗 目下 的 牧牛 
儿 苗 科 均 为 单 系 〈 仅 包括 一 个 种 的 科 除 外 ) (BS=100%; PP=1.0)。 属 级 水 平 ， 桃 金 娘 科 的 校 
JB. МЖЖ (Апворћога), МІЗ A LE, TERHI BUR (Lagerstroemia), ЖЕ 
ДШ АЕ LA. ARSE Monsonia 均 为 单 系 ( 属 下 仪 包括 一 个 种 的 除外 )(BS=100%; 


PP=1.0)。 桃 金 娘 科 的 Corymbia Л. 


桃 金 女 目 为 单 系 类 群 ， 所 包括 6 个 科 的 科 间 关系 得 到 解决 。 桃 金 女 科 和 Vochysiacea Ж 
系 较 近 ， 形 成 一 支 ， 与野 牡 丹 科 是 姐妹 群 。 柳 叶 菜 科 和 王 届 沫 科 是 姐妹 群 ， 使 君子 科 是 柳 叶 


菜 科 + 干 屈 沫 科 的 姐妹 群 。 千 届 沫 科 这 一 分 支 包 括 了 紫 微 属 、 石 榴 属 (Pumicg 及 萎 属 (Tyrapa)， 


干 届 菜 科 ， 而 萎 属 则 隶属 于 萎 科 (Trapaceae)。 柳 叶 菜 科 这 一 分 支 包 括 了 月 见 草 属 、 丁 香 蓝 属 


其 中 石榴 属 在 中 国 植物 志 中 隶 属于 石榴 科 (Punicaceae)， 在 Flora of China 中 将 石榴 属 移 置 于 
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(Ludwigia)、 柳 叶 菜 属 (Epilobium)， 其 中 丁香 蓝 属 为 基部 类 群 ， 


月 见 草 属 和 柳 叶 菜 属 组 成 一 


x. ФЕРЕ БЕ 19 属 ， 属 间 的 系统 关系 与 前 人 基于 形态 学 数据 (Renner，1993) 及 叶 绿 
体 片 段 CRenner, 2004; Goldenberg et al., 2012) 的 研究 结果 有 出 入 。 鉴 于 所 包括 的 属 有 限 ， 
仅 占 全 部 属 的 10% 左 右 ， 且 每 个 属 仅 包 括 一 个 物种 ， 野 牡丹 科 的 系统 发 育 关 系 有 待 进一步 
扩大 样品 进行 研究 。 桃 金 娘 科 包 括 校 属 (Eucalyptus)、Corymbia、 杯 果木 属 、Allosyncarpia、 
Stockwelli. #8 Syzygium). 1&3 &(Psidium). Acca. Plinia 3:9 属 。 前 人 基于 так 的 
系统 发 育 树 结果 表明 ， 桃 金 娘 科 可 以 分 为 两 个 亚 科 ，17 个 族 (Wilson etal., 2005). KAFR 
中 所 包括 的 属 均 隶 属于 桃 金 娘 亚 科 (Myrtoideae), 分 布 于 3 个 族 , 其 中 蒲 桃 属 隶 属于 Syzygieae， 
番 石 榴 属 、4cca 和 Plinia 隶属 于 Myrteae, ЖЖЖ. 1/8. Allosyncarpia, Corymbia 和 
Stockwelli 隶属 于 Eucalypteae, 3 个 族 均 为 单 系 (BS=100%; PP=1.0). 


Hee JLT A NARA, Vivianiaceae 为 基部 类 和 群 ， 入 牛 儿 苗 科 形成 了 一 个 单 系 ， 其 中 
Hypseocharis NEE JRA SAREE, Yee LEA A Мопзота 为 姐妹 群 。 
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E. umbra 
E. cloeziana 
E. sieberi 
E. elata 
E. regnans 
E. pauciflora 
E. patens 
E. marginata 
E Ed 

. erythrocoi 
C. torelliana 
Corymbia citriodora subsp. citriodora 
C. citriodora subsp. variegata 
C. tessellaris 
C. henryi 
C. eximia 
C. maculata 
A. floribunda 
Angophora costata 
C. gummifera 
Afosincamie ternata 

S 


Stockwellia quadrifida 

g% jum cumini 

Gif P. guajava-KY635879.1 
110 Psidium guajava-KX364403. 1 
Plinia trunciflora 

Acca sellowiana 

Ruizterania albiflora 

Qualea grandiflora 

Callisthene erythroclada 
Salvertia convallariodora 
Vochysia acuminata 

Erisma bracteosum 
Korupodendron songweanum 
Pterogastra divarica 
Melastoma candidum 
Tibouchina longifolia 

Nepsera aquatica 
Rhynchanthera bracteata 
Rhexia virginica 

Triolena amazonica 
Merianthera pulchra 

Barthea barthei 

АНЕ Tigridiopalma magnifica 
Opisthocentra clidemioides 
Blakea schlimii 

Allomaieta villosa 

Bertolonia acuminata 

Salpinga maranonensis 
Graffenrieda moritziana 
Miconia dodecandra 
Eriocnema fulva _ 

Henriettea barkeri . 
长 毛 月 见 草 O. villosa subsp. villosa 
О. elata subsp. hookeri 

O. elata subsp. elata 


HW O. biennis 
REH 见 草 О. glazioviana 


grandiflora Ё 
ШЕН Ж О. oakesiana 
小 伦 月 见 草 О. parviflora 
Oenothera argillicola — 
O. picensis subsp. picensis 
O. villaricae й 
Epilobium шеипдепѕіѕ -7 

草 龙 Ludwigia octovalvis 
iG L. indica-KX263727.1 
紫薇 上 indica-KF572028.1 
THEME L. guilinensis 
Lagerstroemia fauriei 
WX L. subcostata 
L. speciosa-KU821692.1 
L. speciosa-KX572149.1 
z: i54 L. intermedia 
L. floribunda 
Trapa maximowiczii 
石榴 Punica granatum 
Laguncularia racemosa 
Lumnitzera líftorea — 
Terminalia guyanensis 
Pelargonium alternans 
Р. echinatum 
Р, fulgidum 
P. incrassatum 
P. citronellum 
Р, cucullatum 
P. quercifolium 
P. nanum 
P. exstipulatum 
P. dichondrifolium 
P. australe _ 

P. cotyledonis 

P. exhibens 

P. tetragonum 

P. myrrhifolium 

P. dolomiticum 

Р. trifidum 

P. transvaalense | 
Erodium absinthoides 

E. chrysanthum 

E. carvifolium 

M. marlothii 

Monsonia emarginata 
Hypseocharis bilobata 
Viviania marifolia 

陆地 福 Gossypium hirsutum 
uj vj Theobroma cacao 
Shorea pachyphylla 
#1177 Arabidopsis thaliana 
欧洲 油菜 Brassica napus 
МШ RI Tapiscia sinensis 
芒果 Mangifera indica 
Commiphora wightii 

— #14 Acer buergerianum 
Leitneria floridana 

ANKE Citrus sinensis 
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桃 金 娘 科 
Myrtaceae 


Vochysiaceae 
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Melastomataceae 
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Onagraceae 


FERR 


Lythraceae 
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Combretaceae 


HEILER 
Geraniaceae 


Vivianiaceae 


外 类 群 
Outgroups 


数字 代表 分 支 的 靳 代 值 BS/ 后 验 概率 PP; 靴 代 值 为 100 且 后 验 概率 为 1.00 的 不 显示 。 


Note: Nodes are labeled with maximum likelihood bootstrap support (first number) and Bayesian posterior 
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probability (second number); Nodes with 100% bootstrap support in the maximum likelihood analysis and 1.00 
posterior probability in the bayesian analysis are unlabeled. 

图 5 基于 蛋白 质 编 码 基 因 构 建 的 桃 金 女 目 及 其 近 缘 类 群 的 系统 发 育 树 

Fig. 5 Topologies of Myrtales and related groups based the protein-coding genes 


2.5 蛋白 质 编码 基因 的 序列 分 化 

为 了 评估 不 同 蛋 白质 编码 基因 在 科 下 系统 发 育 分 析 中 的 应 用 ,我 们 对 野 牡丹 科 及 桃 金 女 
科 序 列 长 度 大 于 200 bp 的 蛋白 质 编码 基因 的 序列 分 化 程度 进行 了 统计 其余 科 因 为 所 包括 
的 属 较 少 不 在 分 析 之 列 )。 野 牡丹 科 19 个 属 的 共享 变异 基因 数目 为 33 个 ， 变 异 百 分 数 范 围 
为 5.84%~29.53%， 变 异 率 最 高 的 5 个 基因 依次 为 rpp122、rps15、matK、ndhF 和 rps3， 其 中 
发 生 插 入 缺失 的 基因 数目 为 12 个 ( 表 4); 而 桃 金 娘 科 9 个 属 的 共享 变异 基因 数目 为 57 个 ， 
日 于 分 析 所 包括 的 属 较 野 牡丹 科 而 言 要 少 ， 其 变异 百分数 较 低 ， 范 围 为 1.31% - 15.78%， 变 
异 率 最 高 的 5 个 基因 依次 为 rps12、ycf1、rp122、rps15 和 matK， 发 生 插入 缺失 的 基因 数目 
为 11 个 〈 表 4)。 
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X4 野 牡丹 科 19 属 及 桃 金 女 科 9 属 的 蛋白 质 编码 基因 序列 变异 统计 


Table 4 Sequence divergence of variable coding regions (>200 bp) from 19 chloroplast genomes of Melastomataceae and 9 chloroplast genomes of Myrtaceae 


时 牡丹 科 Melastomataceae 桃 金 娘 科 Myrtaceae 
插入 插入 
比 对 长 、 插入 缺 ”缺失 BFAD 比 对 长 、 插入 缺 ”缺失 ”变异 百 分 
变异 位 点 MESK í Ж i 变异 位 点 WEEE ^ ai _ 
度 失 数目 AK 数 度 失 数目 АК 数 
片段 i i 
Fragment 一 一 
Total Total 
Aligned Percent Aligned Percent 
Variable Nucleotide Number length Variable Nucleotide Number length 
length variability length variability 
positions substitutions of indels of positions substitutions of indels of 
(bp) : (96) (bp) : (96) 
indels indels 
1 accD 1650 350 270 11 80 21.21 1 479 62 62 0 0 4.19 
2 atpA 1512 168 168 0 0 11.11 1 524 37 37 0 0 2.43 
3 atpB 1 497 133 133 0 0 8.88 1 497 38 38 0 0 2.54 
4 atpE 423 57 57 0 0 13.48 402 7 7 0 0 1.74 
2 atpF 555 91 86 1 5 16.40 570 23 23 0 0 4.04 
6 atpH 246 24 24 0 0 9.76 246 5 Э 0 0 2.03 
7 atpl 744 75 75 0 0 10.08 750 19 19 0 0 2.53 
8 ccsA 960 204 201 2 3 21.25 960 60 60 0 0 6.25 
9 cemA 699 109 105 4 4 15.59 690 22 22 0 0 3.19 
10 clpP 591 71 71 0 0 12.01 591 13 11 1 2 2.20 
11 matK 1572 426 419 4 7 27.10 1527 124 124 0 0 8.12 
12 ndhA 1095 168 168 0 0 15.34 1 093 32 32 0 0 2.93 
13 ndhC 363 47 47 0 0 12.95 363 9 9 0 0 2.48 


14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 


ndhD 
ndhE 
ndhF 
ndhG 
ndhH 
ndhl 
ndhJ 
ndhK 
petA 

petB 

petD 
psaA 
psaB 
psaC 
psbA 

psbB 
psbC 
psbD 
psbE 
psbH 
rbcL 

rpll4 
rpl16 
rpl20 
rpl22 
rpl33 


1512 
306 
2 306 
531 
1182 
513 
477 
684 
978 
660 
483 
2253 
2 205 
246 
1062 
1527 
1422 
1062 
252 
222 
1 428 
369 


405 
552 
201 


264 
41 
558 
88 
159 
82 
51 
94 
134 
56 
37 
168 
189 
20 
83 
161 
123 
62 
16 
22 
123 
46 


83 
163 
33 


264 
41 
513 
88 
159 
74 
51 
94 
134 
56 
37 
168 
189 
20 
83 
161 
123 
62 
16 
22 
123 
46 


69 
100 
33 
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17.46 
13.40 
24.20 
16.57 
13.45 
15.98 
10.69 
13.74 
13.70 
8.48 
7.66 
7.46 
8.57 
8.13 
7.82 
10.54 
8.65 
5.84 
6.35 
9.91 
8.61 
12.47 


20.49 
29.53 
16.42 


1 506 
306 
2 388 
531 
1 182 
522 
477 
855 
963 
648 
483 
2253 
2 205 
246 
1 062 
1527 
1422 
1 062 
252 
222 
1 444 
369 
408 
369 
498 
201 


171 


157 


cO O со © © oO сэ со © > сс © © ©©© © осбс© bE O m 
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ооо ор oc co 


mm 
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5:25 
3.27 
7.16 
3.95 
3.98 
4.21 
2.52 
2.60 
3.84 
2.16 
2.28 
2:53 
1.90 
2.85 
2.64 
2.75 
1.83 
1.69 
1.59 
3.60 
3.53 
2.98 
4.90 
4.07 
7.83 
3.98 


40 rpoA 1014 217 206 1 11 2140 1014 36 36 0 0 3.55 


41 rpoB 3213 413 413 0 0 12.85 3 222 103 103 0 0 3.20 
42 тро С1 2 052 282 282 0 0 13.74 2 070 48 47 1 2.32 
43 rpoC2 4 232 837 760 9 77 19.78 4 179 189 186 2 3 4.52 
44 rpsl1l 417 TI TI 0 0 18.47 417 13 10 1 3 3.12 
45 rps12 393 62 62 0 0 15.78 
46 rps14 303 37 37 0 0 12.21 303 10 10 0 0 3.30 
47 rps15 264 72 64 4 8 27.27 276 22 22 0 0 7.97 
48 rpsl6 252 18 16 1 2 7.14 
49 rps18 315 47 47 0 0 14.92 306 4 4 0 0 1.31 
50 rps19 294 24 57 0 0 19.39 279 20 20 0 0 7.17 
51 rps2 714 101 101 0 0 14.15 711 18 18 0 0 2:93 
52 rps3 654 145 145 0 0 22.17 651 37 37 0 0 5.68 
33 rps4 606 89 89 0 0 14.69 606 22 22 0 0 3.63 
54 rpsó 405 75 75 0 0 18.52 405 15 15 0 0 3.70 
55 ycf1 5712 597 583 7 14 10.45 
56 ycf3 507 43 43 0 0 8.48 507 12 12 0 0 2.37 
57 ycf4 555 88 88 0 0 15.86 555 25 25 0 0 4.50 


3 讨论 与 结论 


3.1 基于 叶绿体 基因 组 序列 与 基于 蛋白 质 编码 基因 构建 的 系统 发 育 树 冲突 

目 级 水 平 及 牧牛 儿 苗 目 内 ， 基 于 叶绿体 基因 组 序列 与 基于 和 蛋白质 编码 基因 所 构建 的 系统 发 育 树 拓 扑 结构 不 一 致 ， 其 原因 可 能 有 两 个 方面 : 首先 ， 基 
的 排列 顺序 。 叶 绿 体 基因 组 中 基因 的 排列 顺序 在 小 的 分 类 单元 内 保守 性 较 高 ， 变 异 程度 小 ， 随 着 分 类 单元 的 增 大 ， 其 变异 程度 往往 提高 。 牧 牛 儿 苗 科 
物种 的 叶绿体 基因 组 发 生 过 高 度 的 基因 重 排 (Blazier et al.，2011)， 基 因 组 序列 当中 的 基因 顺序 在 不 同 物 种 间 差 异 较 大 ， 导 致 全 基因 组 序列 比 对 时 ， 同 一 
个 基因 重复 出 现在 基因 组 的 不 同位 置 。 第 二 ， 基 因 间 隔 区 的 序列 变异 水 平 比 蛋白 质 编 码 基因 要 高 ， 随 着 分 类 单元 的 扩大 ， 如 目 级 水 平 ， 可 能 由 于 基因 间 
隔 区 的 序列 变异 程度 太 高 而 导致 序列 比 对 困难 。 因此, 已 有 的 研究 当中 , 叶绿体 基因 组 数据 应 用 于 目 级 水 平 , 如 石竹 目 (Liu etal., 2018). 3$H (Wu et al., 
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2018) ЖН Н (Dong et al.，2018) 等 采用 的 均 为 蛋白 质 编码 基因 而 非 全 基因 组 序 
列 。 
3.2 桃 金 娘 目 及 其 近 缘 类 群 的 系统 发 育 关系 

Эк Ан Н ЖИЕ) Н Ж/Е T HO» 其 系统 位 置 一 直 为 研究 者 所 关注 (Wang et al., 
2009; Soltis et al.，2011)。 本 研究 基于 叶绿体 基因 组 数据 证 实 了 桃 金 娘 目 和 敌 牛 儿 苗 目的 姐 
妹 群 关系 (BS=100%; PP=1.0)。 
使 君子 科 隶 属于 桃 金 娘 目 , 形态 学 及 分 子 系统 学 证 据 均 不 能 确认 其 系统 位 置 , 最 近 的 研 
究 结 果 表 明 其 可 能 与 柳 叶 菜 科 + 干 届 菜 科 的 关系 较 近 (Soltis et al.，2011)。 本 研究 中 ， 基 于 
139 条 序列 的 矩阵 《〈 桃 金 娘 目 、 牧 牛 儿 苗 目 及 外 类 群 的 蛋白 质 编码 基因 ) 分 析 的 结果 表明 ， 
EE TRSKE FEKRR RBA, 为 姐妹 群 , 获得 较 高 文 持 率 (BS=93%; PP=1.00)， 
进一步 ， 对 仅 包 括 桃 金 娘 目的 两 个 数据 集 C103 条 序列 的 叶绿体 基因 组 与 蛋白 质 编码 基因 ) 
的 分 析 结 果 均 支持 使 君子 科 与 柳 叶 菜 科 + 于 屈 菜 科 的 姐妹 群 关 系 (BS=100%; PP=1.00). 

石榴 属 在 中 国 植物 志 中 隶属 于 石榴 科 ， 在 Flora of China 中 被 移 置 于 于 屈 菜 科 ， 本 研究 
结果 表明 石榴 属 是 千 屈 菜 科 其 余 属 的 姐妹 群 。 鞭 属 在 中 国 植物 志 及 Flora of China 中 均 隶 属 
TER AWE RCE TT RSA 
3.3 野 牡 丹 科 及 桃 金 娘 科 系 统 发 育 分 析 候 选 基 因 

据 英 文 版 中 国 植物 志 ， 野 牡丹 科 主 要 分 布 于 热带 及 亚热带 ， 有 156~166 属 ， 约 4 500 
种 ， 其 中 我 国有 21 属 114 种 。 己 应 用 于 野 牡丹 科 系 统 发 育 分 析 中 的 叶绿体 和 蛋白质 编码 基因 
有 rbcL、ndhF 和 和 rp116 (Clausing & Renner, 2001; Renner, 2004) 等 。 桃 金 娘 科 有 130 属 
约 4 500 种 ， 主 要 分 布 于 地 中 海 、 撒 哈 拉 以 南非 洲 、 马 达 加 斯 加 、 亚 洲 热 带 和 温带 、 澳 大 利 
亚 、 太 平 洋 群岛 、 美 洲 热带 和 南美 等 地 ， 我 国有 10 属 121 种 。 已 应 用 于 桃 金 娘 科 系统 发 育 
分 析 中 的 叶绿体 蛋白 质 编 码 基因 有 rbcL. ndhF. rpl16 和 matK (Sytsma et al., 2004; Wilson 
etal., 2005; Thornhill et al., 2015; Vasconcelos et al., 2017) 等 。 

野 牡丹 科 和 桃 金 娘 科 二 者 均 为 大 科 ， 科 下 包括 的 属 种 多 。 我 们 的 研究 结果 表明 ， 除 上 
述 几 个 基因 外 , 更 多 的 候选 基因 可 以 应 用 于 野 牡丹 科 和 桃 金 娘 科 的 系统 发 育 研究 。 作 为 核心 
DNA 条 形 码 的 rbcL 和 matK CCBOL Plant Working Group，2009)， 序 列 分 化 程度 较 高 ， 在 
时 牡丹 科 中 的 变异 百分数 分 别 为 8.61% 和 27.10%, 在 桃 金 娘 科 中 分 别 为 3.53% 和 8.12%. А. 
有 “最 有 潜力 的 叶绿体 DNA 条 形 码 "之 称 的 ycf1 (Dong etal., 2015) 在 野 牡丹 科 18 个 属 中 
有 基因 人 缺失， 在 桃 金 娘 科 中 的 序列 变异 百分数 为 10.45%。 时 牡丹 科 中 ， 序 列 变异 百分数 在 
10% 以 上 的 基因 有 39 个 ，5% 以 上 的 为 53 个 ， 而 在 桃 金 女 科 中 ， 序 列 变异 百分数 在 10% 以 
上 的 基因 有 2 个 ，5$ 多 以 上 的 为 11 个 ， 这 些 基 因 均 可 成 为 解决 科 下 系统 发 育 关 系 的 重要 候选 
基因 。 
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